时政
财经
科技
虚拟货币
其他
登录
#agentic LLM
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
3天前
这篇论文让人想起agentic LLM还能走多远。LLM内部是否可以有多本体的NTP生成轨迹? 在充足且“行为可观测”的数据前提下,NTP 是把 agentic 模式“语言化并内化”的通用底座;配合 SFT 与 RL(PPO/GRPO)可使单体 LLM 展现广义 agentic 行为。 但是当任务需要真实的异质性、并行探索、在线协商/博弈与非语言状态耦合时,外化的多Agent系统与工具介入仍不可或缺。这也是综述把“agentic workflows”单独成章讨论的原因。
#多智能体之争:Anthropic生态VS单智能体· 22 条信息
#agentic LLM
#NTP
#多Agent系统
#语言模型
#行为可观测
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1周前
这个有点意思,相当于一个可以规划多agent行动的LLM大脑!类似于在claude code里的用opus来自规划,然后创建多个subagent去干活!这就是专门做协调的agentic LLM,如果用在企业内部,就是个manager角色啊!主要是多agent协同的模式抽象成可激活的本体! CoA chain of agents通过动态激活一个模型中的多个角色和工具来推广ReAct/TIR,在减少agent间的喋喋不休的同时保持单一的相干状态。 总体而言,CoA可以训练原生单LLM模拟多agent协作的基础模型,将多agent蒸馏与agent RL相结合,以实现最先进的结果。 Project + Code + Models: Paper:
#多智能体之争:Anthropic生态VS单智能体· 22 条信息
#多Agent协同
#LLM大脑
#CoA
#agentic LLM
#企业manager角色
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
GPT4.5/5代表的预训练范式进入智能滞胀时期,agentic LLM的兴起预示着数字智能演化将进入了一个全新的阶段,而人类语言符号的表达(即整个互联网和书籍的文本数据)已经出色地完成了其作为数字智能“启动程序”(Bootstrapping)的历史进程。
#GPT4.5/5
#智能滞胀
#agentic LLM
#数字智能演化
#启动程序
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞